最夯的Python套件解說✕最夯的資料科學、機器學習技術,
本書帶您一次學會!
Python是近來最熱門的程式語言,也是資料科學、機器學習實作時的首選語言。Python之所以在這些領域大放異彩,就是仰賴了各種功能強大的第三方套件,不過套件百百款,該從哪些下手呢?很簡單,很少用到的先不用花太多時間,我們挑常用、關鍵的先學好!本書為有志於學習資料科學、機器學習的初學者,嚴選出NumPy、Pandas、Matplotlib、OpenCV、scikit-learn、tf.Keras等最強套件,絕對是初學者必須好好掌握的!
NumPy數值運算套件可以做資料高速運算,許多套件也都是以NumPy為基礎建構而成,經常得跟NumPy搭配使用,一定要紮穩這個重要基石;
在面對龐大的資料時,使用Pandas、Matplotlib可以輕鬆做資料整理,並藉由繪圖獲取重要資訊,是資料科學實作的強大利器;
OpenCV是電腦視覺(ComputerVision)領域響叮噹的套件,不管是裁切、縮放、輪廓偵測、過濾影像以強化資訊...各種影像處理功能一應俱全,是影像辨識、機器學習做資料擴增的最強助手;
最後,我們將帶您一窺scikit-learn、tf.Keras這兩個重量級套件如何在機器學習、深度學習領域中發揮關鍵性的作用,我們會實際操演如何利用它們做資料預處理(Preprocessing)、建構KNN/SVM/邏輯斯迴歸(Logisticregression)/決策樹(Decisiontree)/隨機森林(Randomforest)…等監督式學習分類模型;以及建立DNN、CNN等影像辨識神經網路(Neuralnetwork)。
看了本書之後,你將深刻體會到各套件的強大之處,利用短短幾行程式碼,竟然瞬間完成許多運算、建模工作。不過各套件的函式、參數設定可不像網路文章寫的這麼單純,當中有許多設定「眉角」需要特別注意,為此,小編都經過逐一詳測,針對可能遇到的問題添加大量註解,幫助讀者更加理解內容!
本書特色:
□資料科學熱門套件解說
‧紮穩NumPy重要基礎:axis、dimention、陣列切片、各種高速運算函式
‧Pandas資料分析技巧:資料清理、缺失值處理、快速取得各種統計數據
‧Matplotlib資料視覺化:繪製2D/3D圖/子圖、比較資料的分布狀況
‧OpenCV影像處理:影像裁切/縮放/翻轉...做資料擴增,二值化(binarization)/降雜訊...強化重要影像資訊
□最紮實的機器學習、深度學習實戰
‧機器學習的資料預處理(Datapreprocessing)
‧快速建構KNN/SVM/邏輯斯迴歸(Logisticregression)/決策樹(Decisiontree)/隨機森林(Randomforest)...監督式學習分類模型
‧建立DNN、CNN影像辨識神經網路(Neuralnetwork)
‧建模完只是第一步!各模型超參數(Hyperparameter)調整心法大公開!
□本書由【施威銘研究室監修】,書中針對原書進行大量補充,並適當添加註解,幫助讀者更加理解內容!